توسعه کنترلر هوشمند چراغ‌های راهنمایی بر پایه یادگیری تقویتی حالت پیوسته در محیط ترافیکی میکروسکوپیک

Authors

اصلانی, محمد دانشگاه صنعتی خواجه نصیرالدین طوسی

مسگری, محمد سعدی دانشگاه صنعتی خواجه نصیرالدین طوسی

Abstract:

افزایش روزافزون تعداد خودروها و در پی آن ترافیک‌های سنگین شهری چالش بزرگی را برای کنترل بهینه ترافیک شهری برای مهندسین ایجاد کرده است. روش مناسب برای کنترل بهینه ترافیک هرچه باشد یقیناً باید وفق پذیر بوده تا بتواند ترافیک شهری را که دارای طبیعت پویا، پیچیده و تغییرپذیر است را به‌خوبی مدیریت نماید. در این راستا تمرکز اصلی تحقیق حاضر کنترل هوشمند و توزیع یافته چراغ‌های راهنمایی بر پایه یادگیری تقویتی است. کنترل هوشمند چراغ‌های راهنمایی بر پایه یادگیری تقویتی نیاز به یادگیری و تصمیم‌گیری در فضای حالت بزرگ (پیوسته) را دارد. همین امر باعث می‌شود که روش‌های رایج یادگیری تقویتی (حالت گسسته) برای چنین مسائلی (با فضای حالت بزرگ) به‌خوبی قابل بسط نباشند. هدف تحقیق حاضر حل این چالش در مسئله کنترل ترافیک میکروسکوپیک است. در همین راستا نوآوری تحقیق حاضر را می‌توان توسعه کنترلر هوشمند چراغ‌های راهنمایی بر پایه یادگیری تقویتی حالت پیوسته برای حل چالش بزرگ بودن فضای حالت برشمرد. یادگیری تقویتی حالت پیوسته از شباهت سنجی حالات برای تخمین ارزش آن‌ها استفاده می‌کند. در این تحقیق به‌منظور اعتبار سنجی، دو روش یادگیری Q و عملگر-نقاد حالت گسسته نیز پیاده‌سازی و عملکرد آن‌ها با روش پیشنهادی مقایسه شدند. نتایج نشان می‌دهند که روش پیشنهادی منجر به کاهش 16% و 13% زمان سفر در مقایسه با دو روش عملگر-نقاد و یادگیری Q می‌شود.

Upgrade to premium to download articles

Already have an account?login

similar resources

توسعه سامانه‌های چند عامله و یادگیری تقویتی در کنترل هوشمند چراغ‌های راهنمایی

امروزه یکی از معضلات جوامع شهری، ازدحام و ترافیک خودروها در معابر شهری است که منجر به آسیب‌های مختلف اقتصادی، محیط زیستی و اجتماعی می‌شود. برای جلوگیری از این آسیب‌ها، نیاز به بهبود زیر ساخت‌های فعلی حمل و نقل در شهرهای بزرگ بیش از پیش احساس می‌شود. تمرکز مقاله حاضر بر روی کنترل هوشمند چراغ‌های راهنمایی به عنوان یکی از شاخه‌های سیستم‌های حمل و نقل هوشمند با استفاده از سامانه‌های چند عامله یادگی...

full text

تحلیل و بررسی اثرات ترافیکی و زیست محیطی چراغ های هوشمند و چراغهای غیر هوشمند در تقاطع ها

سیستم SCATS یکی از سیستمهای کنترل هوشمند ترافیک است که توسط کامپیوتر مرکز و با دریافت اطلاعات از شناسگرها، فرمان زمان بندی چراغ تقاطع های یک شبکه را صادر می کند. این سیستم در بسیاری از شهرهای بزرگ و برتر در جهان از جمله تهران به کار رفته است. هدف این گزارش ارایه روشی برای ارزیابی کارآیی این سیستم در تهران است. تاکنون در شهرهای مختلف با روشهای گوناگونی، عملکرد شبکه حمل و نقل شهری را قبل و بعد از...

full text

توسعه ایده های یادگیری تقویتی گسسته در یادگیری تقویتی پیوسته برای سیستم های چند عامله

در جهان پیچیده امروز برای انجام کارهای متفاوت گاهی توانایی یک فرد کافی نیست و مشارکت و همکاری افراد نیاز است. در دنیای کامپیوتر نیز سیستم های چند عامله متشکل از تعدادی عامل است که با یکدیگر در یک محیط در تعاملند. این سیستم ها ویژگی های خاصی دارند، از جلمه خود مختاری، عدم دسترسی به اطلاعات سراسری و به اشتراک گذاری دانش. در این سیستم ها تغییرات محیط وابسته به ترکیب عمل تولید شده از همه عامل ها می...

15 صفحه اول

ترکیب یادگیری تقویتی پیوسته و یادگیری باناظر برای ناوبری ربات

استفاده از یادگیری باناظر در ناوبری ربات های متحرک، دارای چالش های جدّی همچون ناسازگاری داده ها، مشکل جمع آوری داده های آموزشی وخطای زیاد در این داده ها می باشد. لیکن استفاده از یادگیری تقویتی، که یک روش یادگیری تعاملی قدرتمند می باشد، مورد توجه واقع شد. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. از این رو در این پایان نامه، یک ایده جدید برای استفاده موثّ...

15 صفحه اول

یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک

در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...

full text

کنترل ترافیک یک چهارراه راهنمایی رانندگی با استفاده از الگوریتم‌های یادگیری تقویتی (یادگیری-Q، سارسا و مسیرهای شایستگی)

یکیازمهمتریناهدافپژوهشدرحوزهحملو نقل،بهینهکردنجریانهای ترافیک است. امروزه با افزایش وسایل نقلیه به طور پیوسته،محدودیت در منابعارائهشدهتوسطزیرساختهایفعلیو ماهیت غیرخطی، پویا و تصادفی بودن جریان ترافیک، استفاده از...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}

Journal title

کنترل

volume 11 issue 2

pages 9- 21

publication date 2017-09

unfollow

{@ msg @}

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com